Trong lĩnh vực Trí tuệ nhân tạo, mô hình hóa chuỗi chuyển hướng sự chú ý từ những khung hình tĩnh sang dòng dữ liệu theo thời gian. Các nhiệm vụ học máy thông thường thường giả định rằng các điểm dữ liệu là Độc lập và Phân bố Giống nhau (IID), nghĩa là thứ tự của các mẫu không ảnh hưởng đến kết quả.
Mô hình hóa chuỗi một cách rõ ràng bác bỏ điều này, tập trung vào ba trụ cột chính:
- Vi phạm Tính bất biến hoán vị: Trong dữ liệu bảng tính, thứ tự cột là tùy ý. Trong chuỗi, thứ tự là yếu tố chính. Việc đổi chỗ "Con mèo ăn con chuột" thành "Con chuột ăn con mèo" hoàn toàn thay đổi thực tế ngữ nghĩa mặc dù các ký hiệu giống hệt nhau.
- Tự hồi quy Tính chất: Chúng ta giả định rằng một quan sát tại thời điểm $t$ được xác định toán học dựa trên lịch sử của nó ($t-1, t-2, \dots, 1$). Điều này đòi hỏi các xác suất chuyển tiếp để ghi nhận cách thông tin phát triển.
- Bản đồ chiều dài thay đổi: Khác với các lưới 28x28 pixel cố định, các chuỗi như câu văn hoặc sóng địa chấn là linh hoạt. Mô hình phải xử lý đầu vào có độ dài $N$ và tạo ra đầu ra có độ dài $M$ bằng cách sử dụng các tham số nhất quán.